值函数相关硕士博士期刊学术论文

值函数相关论文

深度强化学习算法与应用研究现状综述

深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习......

期刊

人工智能深度强化学习值函数策略梯度导航协作复杂环境泛化性鲁棒性

基于作战过程的岛礁兵力配置强化学习算法

针对岛礁守备作战过程中涉及的对海、对陆、对空3类武器，根据岛礁守备作战过程建立模型，提出一种动态动作空间方法。设置敌方武器装......

期刊

强化学习值函数岛礁守备动态动作空间

基于值函数的深度强化学习改进研究

深度强化学习作为机器学习的一个分支,其通过结合深度学习的感知能力与强化学习的决策能力实现了对从感知到行为端到端的学习。目......

学位

深度学习强化学习值函数序列决策

基于扩散风险模型的保险公司最优分红和风险控制策略研究

过去的几十年里,最优分红问题一直是金融保险领域关注的热点问题。随着现代金融保险市场的快速发展,保险公司所涉及的策略由分红逐......

学位

分红注资再保险破产终端值交易费用值函数最优策略扩散风险模型

复合二项模型中具有随机分红时刻的最优红利问题

本文主要在复合二项模型中研究具有随机分红时刻的最优分红问题.该研究是对周期性最优分红问题的进一步拓展,采取随机分红时刻的分......

学位

随机分红最优分红策略值函数压缩映射原理贝尔曼递归算法随机算子

基于时间差分学习的随机跳变系统鲁棒控制

实际工程应用中,由于生产需要、工况变化或紧急的突发状况,系统包含着多种工作模式,既有随时间的状态连续演化,又有受离散时间驱动......

学位

随机跳变系统时间差分学习鲁棒控制黎卡提方程值函数

带有广义方程约束的数学规划的灵敏性分析

本文首先构造了带有广义方程约束的优化问题,对此问题的两种扰动形式进行了灵敏性分析,得到了扰动问题值函数的次微分关于满足Frit......

学位

带有广义方程约束的数学规划值函数灵敏性分析次微分半定锥互补约束数学规划

Cramer-Lundberg模型下分红问题值函数与策略的迭代方法

最优分红问题是金融保险中研究较多的问题之一,其中基于Cramer-Lundberg风险模型的研究也十分普遍.一般说来,要求得最优分红问题的......

学位

最优分红问题值函数迭代策略 Cramer-Lundberg风险模型

深度强化学习中的动作值函数Q估计方法研究

强化学习的优化目标是寻找最优动作序列，解决复杂环境中的决策问题。结合了深度神经网络，深度Q学习(Deep Q-Network，DQN)是一种经典的......

学位

强化学习动作值函数正则化估计方法论文泛化能力学习问题神经网络实验偏差价值估计

分层强化学习的研究及其在多智能体环境中的应用

近年来，人们在强化学习领域的研究已经取得了令人瞩目的成就。然而在场景较为复杂时，传统的强化学习算法面临维度灾难以及长期信度分......

学位

分层强化学习多智能体环境强化学习算法分配问题学习框架维度灾难估计问题多智能体强化学习值函数有效性信度场景

含参DC复合优化问题值函数的Fréchet次微分

利用次微分相关性质,并引入新的约束规范条件,对含参DC复合优化问题的值函数的Fréchet次微分进行了估计.......

期刊

Fréchet次微分值函数 DC复合优化问题 Fréchet subdifferential the value function DC composi

Real Paley-Wiener theorems for the Clifford Fourier transform

与迪拉克操作符和部分衍生物联系了，这份报纸建立一些真实 Paley 牛肉熏香肠类型定理描绘其克利福德·福里尔变换(CFT ) 有紧缩......

期刊

勒贝格定理傅里叶变换维纳傅立叶变换 CFT 值函数偏导数运营商 Clifford Fourier transform Dirac operator P

复杂经济系统集成调控研究

该文共分八章,主要研究:1.复杂经济系统的基础性集成调控研究;2.经济增长点的建筑与调控理论;3.经济结构的转换与调控理论;4.上研......

学位

复杂经济系统集成调控古典解粘性解最优解值函数资产组合经济增长点

金融风险建模与控制的理论方法研究

该文对金融风险控制问题的理论与方法进行了研究,建立了金融风险问题中有关证券投资的若干数学模型,并在一定条件下,得到了证券投......

学位

金融工程证券投资随机最优控制风险规避值函数

基于值函数的强化学习在直复营销中的研究

直复营销即一种可以得到客户直接回应的营销模式。作为企业的一项长期性经营活动,直复营销贯穿于企业发展的整个过程,因此,通常将......

学位

强化学习值函数 Q-learning算法深度Q网络直复营销

基函数自适应的强化学习的神经网络实现的研究

强化学习是机器学习研究中一个重要的方向,是智能体通过与环境交互来学习如何行为的方法。强化学习过程是一个以寻找最优策略为最......

学位

强化学习策略评价策略迭代值函数函数逼近器基函数

一类微分博弈值函数的存在性

本文主要在没有Isaacs条件下,研究带有不对称信息和相关信息的两人零和微分博弈以下两类问题:即上值函数的上共轭的等价形式,以及......

学位

微分博弈不对称信息相关信息 Isaacs条件随机策略值函数

基于动态规划的雷达弱目标检测前跟踪算法研究

随着目标的多样化和实际环境的复杂化,现代雷达的探测能力正在面临十分严峻的挑战,而微弱目标的检测与跟踪问题就是其中之一。检测......

学位

雷达弱目标检测前跟踪动态规划值函数多目标检测跟踪

几类扩散过程的值函数

风险理论是金融数学和精算学中的重要组成部分,主要关注保险公司的商业运营,通过建立相关的风险模型,从而对保险公司经营中的风险......

学位

值函数强马尔可夫性 Dynkin公式首出时首中时

连续时间复合二项模型的带期望折现罚函数的最优分红问题

本文运用随机控制理论研究连续时间复合二项模型带期望折现罚函数的最优分红问题。目的是得到使带期望折现罚函数的累积期望折现分......

学位

连续时间复合二项模型值函数 HJB方程最优分红策略整数点索赔

一种改进阀值函数的小波去噪算法研究

　　小波去噪是一种经典而有效的图像去噪方法，但无论是硬阀值函数还是软阀值函数方法都有自身的缺点。为了克服小波阀值函数去噪中......

会议

改进值函数小波去噪软阀值函数方法信号丢失图像视觉去噪方法

二元变值函数空间的穷举图像序列展示

在变值逻辑体系下,对逻辑函数相空间进行可视化可间接显现逻辑函数的泛函数空间在进行置换与互补扩展后在相空间中的映射.本文建立......

会议

变值逻辑结构状态穷举逻辑函数对称分布随机图示泛函数空间

支付破产时刻赤字的复合泊松模型中最优分红问题

本文考虑的是支付破产时刻赤字的复合泊松模型中的分红问题，正如Dickson，waters(2004)理解的一样，股东应该有义务去支付破产时刻的赤......

会议

支付破产时刻赤字复合泊松模型最优分红指数分布索赔分布数学期望分红问题策略值函数精确解带约束义务股东

非线性人口发展模型的整体经典解

本文考虑有迁移项和竞争因素同时影响的一类非齐次非线性人口发展模型，利用Banach压缩映象原理得到了初边值问题经典解的整体在惟一......

会议

人口发展模型整体经典解初边值问题非线性初值函数

侧限压缩下亚塑性模型参数敏感性研究

　　亚塑性模型起源于非线性张量值函数,没有传统弹塑性理论中相关概念.基于该模型,对于单轴轴对称情况下,引入了一个本构方程,并......

会议

侧限压缩亚塑性模型模型参数弹塑性理论相关概念无粘性土本构方程轴对称值函数下沉量敏感性非线性张量起源单轴

基于随机控制的证券投资决策方法

在假设设证券价格服从维纳过程的基础上，运用随机最优控制理论，研究了带有交易费用的证券投资决策问题，首先给出值函数和效用函数的定......

会议

随机控制证券投资策略随机最优控制理论值函数偏微分方程证券价格效用函数维纳过程决策问题交易费用运用基础导出

范数有界不确定性下的期权定价问题

基于非线性控制理论，研究股票价格具有有界L范数不确定性的期权定价问题在给出新的期权价格定义后，把期仅定价问题归结力求解微分对......

会议

范数有界不确定性期权价格微分对策理论定价问题值函数线性控制理论期权定价方法变分不等式股票价格保值策略敏感性噪声求解风险导出

牛网瓣口在体环向舒缩应变的PPR分析

采用一非参数统计方法投影寻踪回归技术(Projection Pursuit Regression--PPR)建立牛网瓣口在体胃电（刺激）——舒缩应变（响应）关系，得到......

会议

网瓣口投影寻踪回归技术非参数统计方法逐步回归生理状态拟合误差结果比较值函数胃电反刍采食

概率空间上模糊值函数的积分

...

会议

概率空间模糊值函数

一类单周期预、决策定货模型

该文讨论一类单周期二模式预，决策模型（其特例是newsvendor问题）。在建立一般模型之后，作者就一些特例研究了值函数的一些性质，给出了求......

会议

定货量预测值函数

元件测试码求值函数的自动生成

...

会议

元件测试码值函数

Sparre Andersen风险模型中的重置保证再保险(英文)

考虑一个具有常数红利边界的Sparre-Andersen风险模型,在此模型中提出一种新的再保险以保证在公司出现较小的赤字时再保险公司出资......

期刊

Andersen 值函数 Erlang insurance guarantee Poisson discount introducing claim retur

微分对策及其在金融学中的应用

微分对策是对策论在动态情况下的发展，故又称为动态对策。它在军事对抗、航天工程、经济与金融、资源配置领域等具有非常广泛而重要......

学位

微分对策金融学投资策略值函数博弈模型

基于动态规划的最优反馈控制数值算法及其收敛性

本论文考虑一般的有穷维非线性控制系统的有限时区最优反馈控制的数值求解及收敛性问题。　　寻找最优反馈是控制理论梦寐寻以求......

学位

值函数粘性解最优反馈控制有限差分动态规划非线性控制系统

用随机转换控制的方法解决中国证券市场的两个投资问题

雍炯敏和周迅宇[9]十分完整和严密地介绍了随机最优控制的基本理论，主要是针对连续控制.1993年，汤善健和雍炯敏[7]讨论了一个比较一......

学位

最优投资问题值函数动态规划 HJB方程随机转换控制套利数学金融证券市场

半线性热方程的反馈零能控性

本文考虑具有Lipschitz非线性项的半线性热方程：的最优控制问题。我们将运用观测不等式，证明值函数(ψ)作为相应HamiltonJacobi方程......

学位

最优控制零能控性反馈控制值函数半线性热方程

带破产回收的最优风险控制和分红策略

本篇文章主要考虑的是如何最大化全部折现分红和最终的固定资产P的和。其中最终固定资产P表示保险公司在破产时所拥有的固定的可折......

学位

比例再保险最终资产扩散模型值函数分红策略风险控制

离散模型下最优红利再保策略

随着保险市场的不断开放与发展,保险业的竞争越来越激烈,保险企业需要不断开发更具竞争性的产品,以及通过购买再保险等方法来增加......

学位

复合二项模型最优支出策略最优红利策略最优自留额最优再保费比例 HJB方程压缩映射

具有固定交易费用的证券投资决策问题

在Ｐｌｉｓｋａ和Ｓｅｌｂｙ所建立模型的基础上，研究了具有固定交易费用的证券投资决策问题．通过进行函数变换，将证券投资决策的一类多维二阶偏微方程自由边......

期刊

证券投资维纳过程报酬止损函数值函数

由条件f(ωx+ψ)≡f(x)确定的函数f(x)

本文的f(x)是定义在A上的函数,对于任何一个x∈A,都有f(ωx+ψ)=f(x)(其中ω、ψ为常数).众所周知,在上式中当ω=1、ψ≠0时,f(x)......

期刊

周期函数值函数直线图像常数

关于周期函数的最小正周期的存在性

我知道一些周期函数在定义域上存在最小正周期,如sinx,cosx,tanx,cotx等.但有些周期函数如常值函数、狄利克莱函数等均没有最小正......

期刊

周期函数最小正周期函数连续充分条件值函数定义域

证券投资决策的微分对策方法研究

在证券价格存在有界不确定性的假设下，研究了基于最差情况的最优证券投资决策问题．首先，建立了证券投资决策的微分对策模型，然后，证明了......

期刊

证券投资微分对策值函数有界不确定性伊萨克-贝尔曼(Isaacs-Bellman)方程

论心理账户理论对高校助学制度设计的启示

进一步完善高校贫困生助学体制,切实解决高校贫困生问题,是我国高等教育面临的一个十分紧迫而重要的理论课题和现实课题.仅着眼于......

期刊

心理账户非替代性值函数助学体制奖学金

半线性热方程的反馈零能控性

考虑具有Lipschitz非线性项,半线性热方程的最优控制问题.我们将运用观测不等式,证明值函数ψ作为相应Hamilton-Jacobi方程的唯一......

期刊

最优控制零能控性反馈控制值函数 Hamilton-Jacobi方程

带有风险规避的证券投资最优策略

运用随机最优控制理论,建立了带有风险规避的证券投资最优策略问题的数学模型;然后,给出了值函数和风险规避系数的定义,并通过对值......

期刊

证券投资风险规避随机最优控制值函数 HJB偏微分方程

风险敏感性最优控制问题研究

运用随机最优控制理论,研究了风险敏感性随机最优控制问题.给出了值函数和风险规避系数的定义,并通过对值函数进行非线性变换,证明......

期刊

随机最优控制风险敏感性值函数动态规划效用函数

含参DC复合优化问题值函数的Fréchet次微分

利用次微分相关性质,并引入新的约束规范条件,对含参DC复合优化问题的值函数的Fréchet次微分进行了估计.......

期刊

Fréchet次微分值函数 DC复合优化问题 Fréchet subdifferential the value function DC composi

模型自由的离散时间系统的随机线性二次最优控制

针对模型自由的随机线性离散时间系统,通过Q学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,......

期刊

Q学习算法值函数随机线性二次最优控制随机代数方程 Q-learning algorithm Value function Stochastic lin

一次绝对值和式函数的最值问题

一次绝对值函数是我们十分熟悉的一种简单函数，它与方程、分段函数等密切相关，自然成为知识的一个交汇点和高考命题的一个热点．但教材......

期刊

最值问题值函数绝对值和式分段函数高考命题交汇点方程

考虑人寿保险的最优金融决策

不同于以前的最优消费、投资问题研究,本文研究个人投资者的最优金融决策问题--如何决定最优的证券组合、消费和购买人寿保险,使其......

期刊

人寿保险最优金融决策个人投资者最优控制值函数 Stochastic Control HamiltonJacobiBellman(HJB) Equati

看过本文同时还关注